其他
爬虫|爬取全国中小学电脑制作活动技术讲座视频
通过查看源文件可以看到如下三个视频的地址:
将地址一一复制到代码中,就可以下载视频了,请注意尊重原创,保护知识产权,所以我只爬了一个视频示例,另两个请打开“阅读原文”查阅,也可以自行下载查看:
参考代码:
url = 'http://huodong2000.ncet.edu.cn/video/v/shaierbiancheng.mp4'
fname=url.split('/')[-1]#取文件名
with requests.get(url, stream=True) as r:
print('开始下载:')
content_size = int(r.headers['content-length'])
with open(fname, 'wb')as f:
n = 1
for i in r.iter_content(chunk_size=1024):
loaded = n * 1024.0 / content_size
f.write(i)
print('已下载{0:%}'.format(loaded))
n += 1
print('下载结束')
本来想爬NOI网站上的视频,但是对方设置了禁止下载,所以这个代码是爬取不成功的,如果人家不让下载尽量不要爬取,这个文件我一试就爬下来了。
爬虫相关文章
使用BeautifulSoup解析网页及清洗数据
推荐|Python 爬虫系列教程一爬取批量百度图片爬虫|python读写csv文件的方法完成生涯规划表爬虫|以豆瓣为例简单地介绍爬取网站数据的方法爬虫|以豆瓣为例简单地介绍清洗数据的方法